from datasets import Dataset
import os

# 创建一个示例数据集
data = {
    "text": ["这是第一个文本", "这是第二个文本", "这是第三个文本"],
    "label": [0, 1, 0],
    "id": [1, 2, 3]
}

# 创建数据集
dataset = Dataset.from_dict(data)

# 确保目录存在
os.makedirs("/data/dataset", exist_ok=True)

# 保存数据集到磁盘
dataset.save_to_disk("data/dataset")

print("示例数据集已创建并保存到 data/dataset 目录")
print("数据集内容:")
print(dataset)
